查看原文
其他

学术抄袭哪国强?保加利亚和伊朗...

考博之路 2021-09-16

来源:澎湃新闻

近日,美国《科学》杂志刊登了一篇有关学术抄袭全球分布的有趣结论。这个结论是由arXiv在线数据库上数十万论文数据分析得出的,数据显示,德国、美国、日本等国论文“借鉴”的概率相对较低;伊朗、保加利亚等国最为严重;中国的论文抄袭率居中游。


在这张学术抄袭分布图上,颜色由黑到红地标识了剽窃率的从少至多,其中大红色为抄袭最严重的地区。


地图中以黑色标记的国家剽窃率相对最少。德国提交的9201篇论文中,被标记的论文有297篇,概率在3.23%,世界最低。美国紧居其后:提交的26052篇论文中,被标记的有1236篇,概率在4.74%。“黑色阵营”中还有日本和澳大利亚,被标记的概率分别是5.65%和5.89%。


第二梯队是地图上的“暗红色阵营”,代表国家有巴西、印度和中国。其中巴西被标记的论文概率为8%,印度为10.99%,中国则是10.8%,提交的6372篇论文有688篇被标记。


“引用”他人著作最严重的国家是地图上大红色的区域,有保加利亚、埃及和伊朗,其中保加利亚的被标记概率超过了20%。埃及和伊朗分别是18.91%和15.56%。


arXiv是一个收录科学文献预印本的在线数据库,由美国康奈尔大学物理学家Paul Ginsparg创立于1991年,包含了大量的学术文章,已经成为了物理、数学等领域成果发布的学术分享地。每天有接近百万的论文提交,每天出版大约数百篇。任何人都可以申请提交,并且不需要同行专业人士的审阅。


arXiv最重要的特点是开放式获取,每个人都可以免费访问全文数据。这无疑给学术剽窃提供了便捷的条件。


不过,在arXiv上提交的论文需要接受质量检查程序的检查。一个计算机程序会将论文的文本内容与其他发表在arXiv上的论文进行比较,以分辨是否抄袭。Paul Ginsparg对美国科学促进会说:“这是一个非常智能的机器,它有特殊的方法检测大块引用、斜体字文本、引号内容以及数学定理陈述,以避免出现主动错误信息。”


Ginsparg和该校物理学博士生Daniel Citron比较了1991-2012年提交给arXiv的75.7万篇文章。结果发现,“文本再使用”惊人地普遍。过滤掉综述文章和合理引用后,每16位arXiv作者中,就有1位存在大段抄袭其他已发表文章的行为。更令人担忧的是,每1000位作者中就有1人从其他论文中抄袭了近1段文字,但没有标注出处。


由于作者在向arXiv提交论文时,会注明自己的居住国。这就使得哪些国家剽窃率最高一目了然。数据显示,来自美国、加拿大以及欧洲和亚洲少数工业化国家的研究人员提交的论文占arXiv论文的最大份额,而且剽窃率也更低。

 

2011年8月开始,arXiv开始对论文的文本重叠系统性标记,来自151个国家的10多万的作者,一共提交了30多万篇文章。研究这些数据发现,每16个作者提交的论文中,就至少有一次抄袭艰涩标记。

       

不过,Ginsparg表示,这次研究中的“文本重叠”并不一定都是剽窃。一篇综述文章可能引用大量内容,或作者会再利用和略微修改之前文章的语句。此外有趣的是,数据显示一篇论文引用的已发表内容越多,其再被引用率就越低。也就是说如果越接近“抄袭”的论文,价值越低。

博士毕业的去向!

博士延期毕业的十大影响因素

浙财宝典:大神们的考博之路

四川两名博士生当选“最美大学生”!

80后清华博士挂任乌兰察布市副市长,还是考博好

四川一批年轻干部任前公示:两90后女博士拟任市管企业副职

中国科学院大学2019年秋季入学博士研究生招生拟录取分数线

西藏大学2019年博士研究生招生录取资格分数线

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存